|
1.
融合集群度与距离均衡优化的
K-均值聚类算法
王日宏, 崔兴梅
计算机应用
2018, 38 (1):
104-109.
DOI: 10.11772/j.issn.1001-9081.2017071716
针对传统
K-均值算法对初始聚类中心选择较为敏感的问题,提出了一种基于融合集群度与距离均衡优化选择的
K-均值聚类(
K-MCD)算法。首先,基于"集群度"思想选取初始簇中心;然后,遵循所有聚类中心距离总和均衡优化的选择策略,获得最终初始簇中心;最后,对文本集进行向量化处理,并根据优化算法重新选取文本簇中心及聚类效果评价标准进行文本聚类分析。对文本数据集从准确性与稳定性两方面进行仿真实验分析,与
K-均值算法相比,
K-MCD算法在4个文本集上的聚类精确度分别提高了18.6、17.5、24.3与24.6个百分点;在平均进化代数方差方面,
K-MCD算法比
K-均值算法降低了36.99个百分点。仿真结果表明
K-MCD算法能有效提高文本聚类精确度,并具有较好的稳定性。
参考文献 |
相关文章 |
多维度评价
|
|